Researchers across cognitive, neuro-, and computer sciences increasingly reference human-like artificial intelligence and neuroAI. However, the scope and use of the terms are often inconsistent. Contributed research ranges widely from mimicking behaviour, to testing machine learning methods as neurally plausible hypotheses at the cellular or functional levels, or solving engineering problems. However, it cannot be assumed nor expected that progress on one of these three goals will automatically translate to progress in others. Here a simple rubric is proposed to clarify the scope of individual contributions, grounded in their commitments to human-like behaviour, neural plausibility, or benchmark/engineering goals. This is clarified using examples of weak and strong neuroAI and human-like agents, and discussing the generative, corroborate, and corrective ways in which the three dimensions interact with one another. The author maintains that future progress in artificial intelligence will need strong interactions across the disciplines, with iterative feedback loops and meticulous validity tests, leading to both known and yet-unknown advances that may span decades to come.
translated by 谷歌翻译
考虑互动学习的问题设定(IGL),其中学习者的目标是与环境进行最佳互动,而无需明确的奖励以依靠其政策。代理商观察上下文向量,采取行动并接收反馈向量,并使用此信息有效地优化潜在奖励功能的策略。当反馈向量包含该动作时,事先分析的方法失败了,这在许多潜在方案中显着限制了IGL的成功,例如脑部计算机界面(BCI)或人类计算机界面(HCI)应用程序。我们通过创建算法和分析来解决这一问题,该算法和分析即使反馈向量包含以任何方式编码的动作,允许IGL起作用。我们根据监督数据集提供理论保证和大规模实验,以证明新方法的有效性。
translated by 谷歌翻译
人类的文化曲目依赖于创新:我们连续和层次上探讨如何将现有元素组合起来创建新的能力。创新不是孤独的,它依赖于以前解决方案的集体积累和合并。机器学习方法通​​常假定完全连接的多代理网络最适合创新。然而,人类实验室和现场研究表明,动态沟通拓扑可以更强大地实现等级创新。在动态拓扑结构中,人类在单独或小簇中进行创新之间振荡,然后与他人分享结果。据我们所知,在机器学习中,尚未系统地研究多代理拓扑在创新中的作用。目前尚不清楚a)哪些交流拓扑对于哪些创新任务以及b)共享经验的特性改善了多级创新的最佳选择。在这里,我们使用三个不同的创新任务,使用多级分层问题设置(WordCraft)。我们系统地设计了DQNS的网络,分享了他们在不同拓扑(完全连接,小世界,动态,戒指)中共享其重播缓冲区的体验。比较不同任务的不同经验共享拓扑实现的创新水平,这表明,首先,与人类的发现一致,在动态拓扑中共享的经验可以达到整个任务的最高创新水平。其次,当有一条清晰的创新途径时,经验共享并不那么有用。第三,我们提出的两个指标,共享经验的合规性和多样性可以解释不同任务上不同拓扑的成功。这些贡献可以促进我们对最佳AI-AI,人类和人类协作网络的理解,从而激发未来的工具来促进大型组织的集体创新。
translated by 谷歌翻译
近年来,已经引入了越来越多的基于模型的强化学习(RL)方法。鉴于其许多潜在的好处,例如更高的样本效率和快速适应环境变化的潜力,对基于深层模型的RL的兴趣并不奇怪。但是,我们证明,使用最近引入的本地变化适应(LOCA)设置的改进版本,众所周知的基于模型的方法(例如Planet和Dreamerv2)在适应本地环境变化的能力方面表现不佳。结合先前的工作,对其他基于模型的方法Muzero进行了类似的观察,似乎出现了一种趋势,这表明当前基于深层模型的方法具有严重的局限性。我们通过识别损害适应性行为并将其与经常在基于DEEP模型的RL中经常使用的基础技术联系起来的元素,深入研究这种绩效不佳的原因。在线性函数近似的情况下,我们通过证明了线性DyNA的修改版本实现有效适应局部变化,从而验证了这些见解。此外,我们通过实验非线性版本的DYNA来提供详细的见解,以了解构建基于自适应非线性模型方法的挑战。
translated by 谷歌翻译
组织知识库正在从被动档案中转变为人们工作流动的活跃实体。我们正在看到机器学习习惯于启用当人们工作时收集和表面信息的系统,从而使人们与内容之间的联系成为可能,这些系统以前不太明显,以自动识别和突出给定主题的专家。当这些知识基础开始积极地引起人们的关注以及他们从事的内容,尤其是当这项工作仍在进行中时,我们会在工作与社会的交汇处遇到重要的挑战。尽管这样的系统有可能使人们的工作的某些部位更加富有成效或愉快,但它们也可能引入新的工作量,例如,通过让人们扮演专家的角色供其他人接触。这些知识基础也可以通过改变工作的哪些部分,因此得到认可,从而产生深远的社会后果。我们提出了许多公开问题,值得关注和学术界的关注和参与。解决这些问题是确保工作的未来成为那些从事工作的人的美好未来的重要步骤。在该职位论文中,我们希望进入我们认为需要解决尊重社会价值的推荐系统的挑战,我们认为需要进行跨学科讨论。
translated by 谷歌翻译
捍卫深层神经网络免受对抗性示例是AI安全的关键挑战。为了有效地提高鲁棒性,最近的方法集中在对抗训练中的决策边界附近的重要数据点上。但是,这些方法容易受到自动攻击的影响,这是无参数攻击的合奏,可用于可靠评估。在本文中,我们通过实验研究了其脆弱性的原因,发现现有方法会减少真实标签和其他标签的逻辑之间的利润,同时保持其梯度规范非微小值。减少的边缘和非微小梯度规范会导致其脆弱性,因为最大的logit可以轻松地被扰动翻转。我们的实验还表明,logit边缘的直方图具有两个峰,即小和大的logit边缘。从观察结果来看,我们提出了切换单重损失(SOVR),当数据具有较小的logit rumgins时,它会使用单重损失,从而增加边缘。我们发现,SOVR比现有方法增加了logit的利润率,同时使梯度规范保持较小,并且在针对自动攻击的鲁棒性方面超越了它们。
translated by 谷歌翻译
肺癌是全球癌症死亡的主要原因,肺腺癌是最普遍的肺癌形式。 EGFR阳性肺腺癌已被证明对TKI治疗的反应率很高,这是肺癌分子测试的基本性质。尽管目前的指南考虑必要测试,但很大一部分患者并未常规化,导致数百万的人未接受最佳治疗肺癌。测序是EGFR突变分子测试的黄金标准,但是结果可能需要数周的时间才能回来,这在时间限制的情况下并不理想。能够快速,便宜地检测EGFR突变的替代筛查工具的开发,同时保存组织以进行测序可以帮助减少受比较治疗的患者的数量。我们提出了一种多模式方法,该方法将病理图像和临床变量整合在一起,以预测EGFR突变状态,迄今为止最大的临床队列中的AUC为84%。这样的计算模型可以以很少的额外成本进行大部分部署。它的临床应用可以减少中国接受亚最佳治疗的患者数量53.1%,在美国将高达96.6%的患者减少96.6%。
translated by 谷歌翻译
Covid-19严重程度是由于SARS-COV-2的并发症,但感染的临床过程因个体而异,强调需要更好地了解分子水平的疾病。我们使用从有和没有Covid-19的患者获得的临床和多个分子数据(或视图),他们(或不)被录取为重症监护病房,以阐明Covid-19严重程度。共同关联视图并分离Covid-19组的方法(即,一步法)专注于线性关系。然而,观点和Covid-19患者组之间的关系太复杂,无法通过线性方法来理解。现有的非线性一步法方法不能用于识别签名,以帮助我们了解疾病的复杂性。我们提出了深入的IDA(综合歧视分析)来解决我们兴趣问题的分析挑战。 Deep IDA学习两个或多个视图的非线性投影,从而最大限度地关联视图并在每个视图中分开类,并允许具有可解释的发现的特征排序。与其他最先进的方法相比,我们的申请表明,与其他最先进的方法相比,Deave IDA具有竞争性分类率,并且能够识别有助于了解Covid-19严重程度的分子签名。
translated by 谷歌翻译